Les noms propres se traduisent-ils ? Étude d'un corpus multilingue

نویسندگان

  • Émeline Lecuit
  • Denis Maurel
  • Dusko Vitas
چکیده

In this paper, we tackle the problem of the translation of proper names. We introduce our hypothesis according to which proper names can be translated more often than most people seem to think. Then, we describe the construction of a parallel multilingual corpus used to illustrate our point. We eventually evaluate both the advantages and limits of this corpus in our study. Mots clés : noms propres, traduction, corpus multilingue aligné

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Fuzzy categorization and the limitations of Intonational Phonology

Cette étude montre que les locuteurs retiennent et utilisent systématiquement des informations détaillées qui vont au-delà des contrastes representés par la phonologie intonative. Les sujets ont d’abord imité des énoncés synthétisés avec diverses courbes de f0. Ensuite, ils ont imité leurs propres productions à travers plusieurs séances successives. Des courbes de f0 stables ne se sont établies...

متن کامل

Génération des prononciations de noms propres à l'aide des Champs Aléatoires Conditionnels (Pronunciation generation for proper names using Conditional Random Fields) [in French]

Dans cet article, nous proposons une approche de conversion graphème-phonème pour les noms propres. L'approche repose sur une méthode probabiliste : les Champs Aléatoires Conditionnels (Conditional Random Fields, CRF). Les CRFs donnent une prévision à long terme, n'exigent pas l'indépendance des observations et permettent l'intégration de tags. Dans nos travaux antérieurs, l'approche de convers...

متن کامل

Réconciliation d'alignements multi-lingues dans BioPortal

Résumé : De nos jours, les ontologies sont souvent développées de manière multilingue. Cependant, pour des raisons historiques, dans le domaine biomédical, de nombreuses ontologies ou terminologies ont été traduites d'une langue à une autre ou sont maintenues explicitement dans chaque langue. Cela génère deux ontologies potentiellement alignées mais avec leurs propres spécificités (format, déve...

متن کامل

Le projet Hippo: recherche en Automatisation de donnees Stylometriques a partir de L'oeuvre d'hippocrate

Le Projet Hippo est une recherche sur l'oeuvre d'Hippocrate men6e depuis trois ans par une ~quipe de quatre professeurs, d'assistants, d'un analyste et d'un programmeur, ainsi que d'une soci~t~ commerciale de consultants en statistique. Poursuivi ~. l'universit~ Laval de Qu6bec, ce travail est subventionn~ par l'universit6 elle-m~me, par le Gouver-nement du Qu6bec et par le Conseil des Arts du ...

متن کامل

Ajout de nouveaux noms propres au vocabulaire d'un système de transcription en utilisant un corpus diachronique

Proper names are usually keys to understand the information contained in a document. Our work focuses on increasing the vocabulary size of a speech transcription system by automatically retrieving proper names from contemporary diachronic text corpus. We assume that some proper names appear in documents relating to the same time period and in similar lexical contexts. We proposed methods that d...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • CoRR

دوره abs/1407.1605  شماره 

صفحات  -

تاریخ انتشار 2014